package com.czk.rdd.builder

import org.apache.spark.rdd.RDD
import org.apache.spark.{SparkConf, SparkContext}

/**
 * 从文件中创建rdd
 *
 * @Author:ChenZhangKun
 * @Date: 2021/12/8 15:28
 */
object Spark_02_RDD_File {
  def main(args: Array[String]): Unit = {
    val sparkConf = new SparkConf().setMaster("local[*]").setAppName("RDD")
    val sc = new SparkContext(sparkConf)

    // 从文件中创建rdd,也可以是目录名称
    val rdd: RDD[String] = sc.textFile("F:\\IdeaProjects\\bigData\\spark\\datas\\test.txt")
    // path路径可以使用通配符
    // sc.textFile("data/1*.txt")
    // path还可以是分布式路径
    // sc.textFile("hdfs://linux1:8082/test.txt")
    rdd.collect().foreach(println)
  }
}
